1 Introducción
1 Informes de las Casen e información básica:
http://observatorio.ministeriodesarrollosocial.gob.cl/encuesta-casen-2011
2 El problema
Nos encontramos con inconsistencias en el cálculo de ingresos, pero como demostraremos, creemos que es problema de interpretación y no de método o base de datos corrupta.
2.1 Los ingresos
Recordemos los cuatro datos fundamentales de la generación de los ingresos:
| Tipo | Ingreso total | Ingreso autónomo | Ingreso del trabajo | Ingreso de la ocupación principal |
| año | ||||
| 2020 | ytotcor | yautcor | ytrabajocor | yoprcor |
| 2017 | ytotcor | yautcor | ytrabajocor | yoprcor |
| 2015 | ytotcor | yautcor | ytrabajocor | yoprcor |
| 2013 | ytotcor | yautcor | ytrabajocor | yoprcor |
| 2011 | ytrabaj | yautaj | ytrabaj | yopraj |
| 2009 | ytrabaj | yautaj | ytrabaj | yopraj |
| 2006 | ytrabaj | yautaj | ytrabaj | yopraj |
3 Metodología y fuentes de datos
Nuestra metodología fue la de encontrar publicaciones oficiales con datos calculados de la Casen y compararlos con cálculos propios.
3.1 Metodología.
En general la Casen no es analizada a nivel de personas, sino que de hogares.
La página de la Casen 2020 en pandemia analizada contiene un excel con datos calculados. Son todos referidos a hogares. Uno se llama:
“Ingreso promedio de los hogares por tipo de ingreso y región”, con lo que se tiene que hacer el siguiente cálculo, por ejemplo para la variable ytrabajocorh:
para cada hogar la Casen lleva asociado la variable ytrabajocorh que significa “Ingreso del trabajo del hogar corregido” que se repite para cada registro perteneciente a un hogar (folio). Se transforma la tabla y se hace un sólo registro con el ingreso familiar. Se promedian en una región. Si bien el cálculo es simple, nos da cierto nivel de complejidad que hará notar con mayor facilidad los errores:
3.2 Verificación para el Censo 2020
3.2.1 Bases de datos
Los ejercicios resultan con los $ a noviembre de cada año.
Nuestra mayor preocupación era que las cifras de ingresos del Censo 2020 coincidieran con nuestros cálculos, por lo que la primera base de datos que buscamos fue ella.
Para ello calculamos el ingreso promedio de los hogares por tipo de ingreso y región, 2006-2020, ($ noviembre de cada año
title
title
3.2.2 Verificación de nuestros cálculos con datos oficiales del 2020
# casen2020 <- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2020.rds")
# casen2020 <- mutate_if(casen2020, is.factor, as.character)
# casen2017 <- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2017_c.rds")
# casen2017 <- mutate_if(casen2017, is.factor, as.character)
# casen2015 <- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2015_c.rds")
# casen2015 <- mutate_if(casen2015, is.factor, as.character)
# casen2013 <- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2013_c.rds")
# casen2013 <- mutate_if(casen2013, is.factor, as.character)
# casen2011 <- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2011_c.rds")
# casen2011 <- mutate_if(casen2011, is.factor, as.character)
# casen2009 <- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2009_c.rds")
# casen2009 <- mutate_if(casen2009, is.factor, as.character)
# casen2006 <- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2006_c.rds")
# casen2006 <- mutate_if(casen2006, is.factor, as.character)
casen2006 <- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2006_c.rds")
casen2006 <- mutate_if(casen2006, is.factor, as.character)
casen2009 <- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2009_c.rds")
casen2009 <- mutate_if(casen2009, is.factor, as.character)
casen2011 <- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2011_c.rds")
casen2011 <- mutate_if(casen2011, is.factor, as.character)
casen2013 <- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2013_c.rds")
casen2013 <- mutate_if(casen2013, is.factor, as.character)
casen2015 <- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2015_c.rds")
casen2015 <- mutate_if(casen2015, is.factor, as.character)
casen2017 <- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2017_c.rds")
casen2017 <- mutate_if(casen2017, is.factor, as.character)
# casen2020 <- read.spss(file="C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2020.sav", to.data.frame=TRUE)
# saveRDS(casen2020,"casen2020.rds")
casen2020 <- readRDS("casen2020.rds")
casen2020 <- mutate_if(casen2020, is.factor, as.character)
reg_20 <- unique(casen2020$region)
# length(reg_20)
reg_17 <- unique(casen2017$region)
# length(reg_17)
reg_15 <- unique(casen2015$region)
# length(reg_15)
reg_13 <- unique(casen2013$region)
# length(reg_13)
reg_11 <- unique(casen2011$region)
# length(reg_11)
reg_09 <- unique(casen2009$REGION)
# length(reg_09)
reg_06 <- unique(casen2006$R)
# length(reg_06)3.2.2.1 Ingreso del trabajo hogar: ytrabajocorh
tabla_prom_reg <- data.frame()
for (i in reg_20) {
casen_fh <- filter(casen2020, casen2020$region == i)
casen_fh <- casen_fh[,c("region","folio","ytrabajocorh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
promedio = mean(rr$ytrabajocorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
# tabla_prom_regtabla_ing_aut <- read_xlsx("ingreso_del_trabajo_oficial_2020.xlsx")
names(tabla_ing_aut)[3] <- "region"
names(tabla_ing_aut)[1] <- "region_c"
tabla_unida = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_unida <- tabla_unida[,-c(3)]
# kbl(tabla_unida) %>%
# kable_styling(bootstrap_options = c("striped", "hover")) %>%
# kable_paper() %>%
# scroll_box(width = "100%", height = "300px")p <- plot_ly(tabla_unida, width = 1200, x = ~
region, y = ~promedio) %>%
add_lines()
p <- p %>% add_trace(y = ~`Ingreso del trabajo`, name = 'ingreso del trabajo oficial', mode = 'markers')
p 3.2.3 Ingreso autonomo del hogar: yautcorh
tabla_prom_reg <- data.frame()
for (i in reg_20) {
casen_fh <- filter(casen2020, casen2020$region == i)
casen_fh <- casen_fh[,c("region","folio","yautcorh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
promedio = mean(rr$yautcorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_ing_aut <- read_xlsx("ingreso_autonomo_2020_3.xlsx")
names(tabla_ing_aut)[3] <- "region"
tabla_unida = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_unida <- tabla_unida[,-c(3)]
kbl(tabla_unida) %>%
kable_styling(bootstrap_options = c("striped", "hover")) %>%
kable_paper() %>%
scroll_box(width = "100%", height = "300px")| region | promedio | ingreso_autonomo |
|---|---|---|
| Región de Antofagasta | 1033562.4 | 1070106 |
| Región de Arica y Parinacota | 729823.9 | 722752 |
| Región de Atacama | 835951.1 | 837976 |
| Región de Aysén del Gral. Carlos Ibáñez del Campo | 967604.2 | 948155 |
| Región de Coquimbo | 652691.3 | 693211 |
| Región de La Araucanía | 563733.0 | 609484 |
| Región de Los Lagos | 675912.4 | 735200 |
| Región de Los Ríos | 657513.9 | 679825 |
| Región de Magallanes y de la Antártica Chilena | 1067639.9 | 1082958 |
| Región de Ñuble | 536982.2 | 559368 |
| Región de Tarapacá | 905914.3 | 925396 |
| Región de Valparaíso | 771366.7 | 775964 |
| Región del Biobío | 691263.4 | 722494 |
| Región del Libertador Gral. Bernardo O’Higgins | 707819.6 | 723921 |
| Región del Maule | 656891.5 | 676096 |
| Región Metropolitana de Santiago | 1222056.5 | 1161517 |
p <- plot_ly(tabla_unida, width = 1200, x = ~
region, y = ~promedio) %>%
add_lines()
p <- p %>% add_trace(y = ~ingreso_autonomo, name = 'ingreso autonomo oficial', mode = 'markers')
p 3.2.4 Ingreso del subsidio monetario: ysubh
tabla_prom_reg <- data.frame()
for (i in reg_20) {
casen_fh <- filter(casen2020, casen2020$region == i)
casen_fh <- casen_fh[,c("region","folio","ysubh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
promedio = mean(rr$ysubh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_ing_aut <- read_xlsx("subsidios_monetarios_oficial_2020.xlsx")
names(tabla_ing_aut)[3] <- "region"
names(tabla_ing_aut)[1] <- "region_c"
tabla_unida = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_unida <- tabla_unida[,-c(3)]
kbl(tabla_unida) %>%
kable_styling(bootstrap_options = c("striped", "hover")) %>%
kable_paper() %>%
scroll_box(width = "100%", height = "300px")| region | promedio | Subsidios monetarios |
|---|---|---|
| Región de Antofagasta | 41288.96 | 40778.06 |
| Región de Arica y Parinacota | 58303.43 | 57346.83 |
| Región de Atacama | 53926.23 | 53825.15 |
| Región de Aysén del Gral. Carlos Ibáñez del Campo | 50612.77 | 50549.10 |
| Región de Coquimbo | 62351.79 | 58729.66 |
| Región de La Araucanía | 80434.04 | 77115.20 |
| Región de Los Lagos | 70241.05 | 64956.55 |
| Región de Los Ríos | 71363.66 | 71456.45 |
| Región de Magallanes y de la Antártica Chilena | 43825.70 | 43936.34 |
| Región de Ñuble | 74955.39 | 75234.80 |
| Región de Tarapacá | 46597.95 | 44113.69 |
| Región de Valparaíso | 56153.71 | 54399.97 |
| Región del Biobío | 63475.73 | 61586.01 |
| Región del Libertador Gral. Bernardo O’Higgins | 60012.31 | 59173.73 |
| Región del Maule | 69962.72 | 67472.14 |
| Región Metropolitana de Santiago | 42914.86 | 43006.41 |
p <- plot_ly(tabla_unida, width = 1200, x = ~
region, y = ~promedio) %>%
add_lines()
p <- p %>% add_trace(y = ~`Subsidios monetarios`, name = 'ingreso del subsidio monetarios oficial', mode = 'markers')
p 3.2.5 Ingreso monetario: ymonecorh
tabla_prom_reg <- data.frame()
for (i in reg_20) {
casen_fh <- filter(casen2020, casen2020$region == i)
casen_fh <- casen_fh[,c("region","folio","ymonecorh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
promedio = mean(rr$ymonecorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_ing_aut <- read_xlsx("ingreso_monetario_oficial_2020.xlsx")
names(tabla_ing_aut)[3] <- "region"
names(tabla_ing_aut)[1] <- "region_c"
tabla_unida = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_unida <- tabla_unida[,-c(3)]
kbl(tabla_unida) %>%
kable_styling(bootstrap_options = c("striped", "hover")) %>%
kable_paper() %>%
scroll_box(width = "100%", height = "300px")| region | promedio | Ingreso monetario |
|---|---|---|
| Región de Antofagasta | 1074851.4 | 1110884.1 |
| Región de Arica y Parinacota | 788127.3 | 780099.2 |
| Región de Atacama | 889877.3 | 891801.2 |
| Región de Aysén del Gral. Carlos Ibáñez del Campo | 1018217.0 | 998704.5 |
| Región de Coquimbo | 715043.1 | 751940.8 |
| Región de La Araucanía | 644167.1 | 686598.9 |
| Región de Los Lagos | 746153.4 | 800156.2 |
| Región de Los Ríos | 728877.5 | 751281.1 |
| Región de Magallanes y de la Antártica Chilena | 1111465.6 | 1126894.2 |
| Región de Ñuble | 611937.6 | 634603.0 |
| Región de Tarapacá | 952512.3 | 969509.3 |
| Región de Valparaíso | 827520.4 | 830363.7 |
| Región del Biobío | 754739.2 | 784080.2 |
| Región del Libertador Gral. Bernardo O’Higgins | 767831.9 | 783094.9 |
| Región del Maule | 726854.2 | 743567.7 |
| Región Metropolitana de Santiago | 1264971.3 | 1204523.7 |
p <- plot_ly(tabla_unida, width = 1200, x = ~
region, y = ~promedio) %>%
add_lines()
p <- p %>% add_trace(y = ~`Ingreso monetario`, name = 'ingreso monetario oficial', mode = 'markers')
p La coincidencia es prácticamente total. Realizareamos la comparación con otro año y otra variable:
4 Otra comprobación
Compararemos nuestros cálculos para otro año con los datos oficiales la variable: ytrabajocorh 2017
tabla_prom_reg <- data.frame()
for (i in reg_17) {
casen_fh <- filter(casen2017, casen2017$region == i)
casen_fh <- casen_fh[,c("region","folio","ytrabajocorh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
promedio_2017 = mean(rr$ytrabajocorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_ing_aut <- read_xlsx("ingreso_del_trabajo_oficial_2017.xlsx")
names(tabla_ing_aut)[3] <- "region"
names(tabla_ing_aut)[1] <- "region_c"
tabla_2017 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2017 <- tabla_2017[,-c(3)]
kbl(tabla_2017) %>%
kable_styling(bootstrap_options = c("striped", "hover")) %>%
kable_paper() %>%
scroll_box(width = "100%", height = "300px")| region | promedio_2017 | Ingreso del trabajo 2017 |
|---|---|---|
| Región de Antofagasta | 932541.0 | 974641.4 |
| Región de Arica y Parinacota | 600641.8 | 584868.1 |
| Región de Atacama | 685371.7 | 725666.9 |
| Región de Ayséndel Gral. Carlos Ibáñez del Campo | 896174.9 | NA |
| Región de Coquimbo | 496064.1 | 543329.2 |
| Región de La Araucanía | 494977.9 | 526971.2 |
| Región de Los Lagos | 603038.6 | 616955.3 |
| Región de Los Ríos | 558418.5 | 572722.4 |
| Región de Magallanes y de la Antártica Chilena | 991709.9 | 951359.1 |
| Región de Ñuble | 436229.9 | 450966.8 |
| Región de Tarapacá | 798910.2 | 773927.6 |
| Región de Valparaíso | 638730.9 | 650047.1 |
| Región del Biobío | 526766.1 | 567735.6 |
| Región del Libertador Gral. Bernardo O’Higgins | 525606.8 | NA |
| Región del Maule | 509444.0 | 531345.3 |
| Región Metropolitana de Santiago | 1110214.6 | 1029813.4 |
p <- plot_ly(tabla_2017, width = 1200, x = ~
region, y = ~promedio_2017) %>%
add_lines()
p <- p %>% add_trace(y = ~`Ingreso del trabajo 2017`, name = 'ingreso del trabajo 2017 oficial', mode = 'markers')
p 5 Generalización
5.1 yautcorh 2009-2020
datos_oficiales <- read_xlsx("ingresos_oficiales_2006-2020.xlsx")
datos_oficiales <- cbind(datos_oficiales[,c(9,10)],mutate_if(datos_oficiales[,2:8], is.character, as.numeric))
datos_oficiales <- filter(datos_oficiales, grepl("trabajo", ingreso) )
# datos_oficiales
# kbl(datos_oficiales) %>%
# kable_styling(bootstrap_options = c("striped", "hover")) %>%
# kable_paper() %>%
# scroll_box(width = "100%", height = "300px")#### 2020
tabla_prom_reg <- data.frame()
for (i in reg_20) {
casen_fh <- filter(casen2020, casen2020$region == i)
casen_fh <- casen_fh[,c("region","folio","ytrabajocorh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2020 = mean(rr$ytrabajocorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2020")]
tabla_2020 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2020 <- tabla_2020[,-c(3)]
tabla_prom_reg <- data.frame()
for (i in reg_17) {
casen_fh <- filter(casen2017, casen2017$region == i)
casen_fh <- casen_fh[,c("region","folio","ytrabajocorh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2017 = mean(rr$ytrabajocorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2017")]
tabla_2017 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2017 <- tabla_2017[,-c(3)]
#### 2015
tabla_prom_reg <- data.frame()
for (i in reg_15) {
casen_fh <- filter(casen2015, casen2015$region == i)
casen_fh <- casen_fh[,c("region","folio.x","ytrabajoCorh")]
casen_fh$folio.x <- as.character(casen_fh$folio.x)
tabla <- table(casen_fh$folio.x)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio.x","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio.x", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio.x ), ]
tabla_reg <- data.frame(
region = i,
calculado_2015 = mean(rr$ytrabajoCorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2015")]
tabla_2015 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2015 <- tabla_2015[,-c(3)]
tabla_2015$calculado_2015 <- as.numeric(tabla_2015$calculado_2015)
tabla_2015$region[tabla_2015$region == "Región del Libertador Gral. Bernardo O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
#### 2013
tabla_prom_reg <- data.frame()
for (i in reg_13) {
casen_fh <- filter(casen2013, casen2013$region == i)
casen_fh <- casen_fh[,c("region","folio","ytrabajoCorh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2013 = mean(rr$ytrabajoCorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2013")]
tabla_2013 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2013 <- tabla_2013[,-c(3)]
tabla_2013$region[tabla_2013$region == "I. Tarapaca"] <- "Región de Tarapacá"
tabla_2013$region[tabla_2013$region == "II. Antofagasta"] <- "Región de Antofagasta"
tabla_2013$region[tabla_2013$region == "III. Atacama"] <- "Región de Atacama"
tabla_2013$region[tabla_2013$region == "IV. Coquimbo"] <- "Región de Coquimbo"
tabla_2013$region[tabla_2013$region == "IX. La Araucanía"] <- "Región de La Araucanía"
tabla_2013$region[tabla_2013$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2013$region[tabla_2013$region == "V. Valparaíso"] <- "Región de Valparaíso"
tabla_2013$region[tabla_2013$region == "VI. O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2013$region[tabla_2013$region == "VII. Maule"] <- "Región del Maule"
tabla_2013$region[tabla_2013$region == "VIII. Biobío"] <- "Región del Biobío"
tabla_2013$region[tabla_2013$region == "X. Los Lagos"] <- "Región de Los Lagos"
tabla_2013$region[tabla_2013$region == "XI. Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2013$region[tabla_2013$region == "XII. Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2013$region[tabla_2013$region == "XIV. Los Ríos"] <- "Región de Los Ríos"
tabla_2013$region[tabla_2013$region == "XV. Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2013$calculado_2013 <- as.numeric(tabla_2013$calculado_2013)
#### 2011
tabla_prom_reg <- data.frame()
for (i in reg_11) {
casen_fh <- filter(casen2011, casen2011$region == i)
casen_fh <- casen_fh[,c("region","folio","ytrabhaj")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2011 = mean(rr$ytrabhaj)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2011")]
tabla_2011 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2011 <- tabla_2011[,-c(3)]
tabla_2011$region[tabla_2011$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2011$region[tabla_2011$region == "Araucanía"] <- "Región de La Araucanía"
tabla_2011$region[tabla_2011$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2011$region[tabla_2011$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2011$region[tabla_2011$region == "Bio Bio"] <- "Región del Biobío"
tabla_2011$region[tabla_2011$region == "Copiapó"] <- "Región de Atacama"
tabla_2011$region[tabla_2011$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2011$region[tabla_2011$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2011$region[tabla_2011$region == "Los Ríos"] <- "Región de Los Ríos"
tabla_2011$region[tabla_2011$region == "Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2011$region[tabla_2011$region == "Maule"] <- "Región del Maule"
tabla_2011$region[tabla_2011$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2011$region[tabla_2011$region == "O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2011$region[tabla_2011$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2011$region[tabla_2011$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2011$calculado_2011 <- as.numeric(tabla_2011$calculado_2011)
#### 2009
tabla_prom_reg <- data.frame()
for (i in reg_09) {
casen_fh <- filter(casen2009, casen2009$REGION == i)
casen_fh <- casen_fh[,c("REGION","FOLIO","YTRABHAJ")]
casen_fh$FOLIO <- as.character(casen_fh$FOLIO)
tabla <- table(casen_fh$FOLIO)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("FOLIO","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "FOLIO", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$FOLIO ), ]
tabla_reg <- data.frame(
region = i,
calculado_2009 = mean(rr$YTRABHAJ)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2009")]
tabla_2009 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2009 <- tabla_2009[,-c(3)]
tabla_2009$region[tabla_2009$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2009$region[tabla_2009$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2009$region[tabla_2009$region == "Atacama"] <- "Región de Atacama"
tabla_2009$region[tabla_2009$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2009$region[tabla_2009$region == "Bío Bío"] <- "Región del Biobío"
tabla_2009$region[tabla_2009$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2009$region[tabla_2009$region == "La Araucanía"] <- "Región de La Araucanía"
tabla_2009$region[tabla_2009$region == "Libertador Bernardo O´Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2009$region[tabla_2009$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2009$region[tabla_2009$region == "Los Rios"] <- "Región de Los Ríos"
tabla_2009$region[tabla_2009$region == "Magallanes Y La Antártica Chilena"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2009$region[tabla_2009$region == "Maule"] <- "Región del Maule"
tabla_2009$region[tabla_2009$region == "Región Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2009$region[tabla_2009$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2009$region[tabla_2009$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2009$calculado_2009 <- as.numeric(tabla_2009$calculado_2009)
tabla_2017$region[tabla_2017$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2017$region[tabla_2017$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2020$region[tabla_2020$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2020$region[tabla_2020$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"ingresos = merge(x = tabla_2017, y = tabla_2020, by = "region", all.x = T)
ingresos = merge(x = tabla_2015, y = ingresos, by = "region", all.x = T)
ingresos = merge(x = tabla_2013, y = ingresos, by = "region", all.x = T)
ingresos = merge(x = tabla_2011, y = ingresos, by = "region", all.x = T)
ingresos = merge(x = tabla_2009, y = ingresos, by = "region", all.x = T)
datos_oficiales$region[datos_oficiales$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
datos_oficiales$region[datos_oficiales$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_f = merge( x = ingresos, y = datos_oficiales, by = "region" , all.x = T)
tabla_f <- tabla_f[,c(8,1:7,9:15)]
tabla_f$por_09_11 <- 100*tabla_f$calculado_2009/tabla_f$calculado_2011
tabla_f$por_11_13 <- 100*tabla_f$calculado_2011/tabla_f$calculado_2013
tabla_f$por_13_15 <- 100*tabla_f$calculado_2013/tabla_f$calculado_2015
tabla_f$por_15_17 <- 100*tabla_f$calculado_2015/tabla_f$calculado_2017
tabla_f$por_17_20 <- 100*tabla_f$calculado_2017/tabla_f$calculado_2020
tabla_f%>% datatable(extensions = 'Buttons',class = 'cell-border stripe',
options = list(
dom = 'Blfrtip',
buttons = c('copy', 'csv', 'excel', 'pdf', 'print'),
pageLength = 5,
autoWidth = TRUE,
scrollX = TRUE,
lengthMenu = list(c(10,25,50,-1),c(10,25,50,"All"))
)) 6 Comparación de los ingresos por tipo y región entre los años 2017-2020
p <- plot_ly(tabla_f, width = 1200, x = ~region, y = ~calculado_2009, name = 'calculado 2009', mode = 'markers') %>% add_lines()
p <- p %>% add_lines(y = ~calculado_2011, name = 'calculado 2011', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2013, name = 'calculado 2013', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2015, name = 'calculado 2015', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2017, name = 'calculado 2017', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2020, name = 'calculado 2020', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2009`, name = 'Oficial 2009', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2011`, name = 'Oficial 2011', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2013`, name = 'Oficial 2013', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2015`, name = 'Oficial 2015', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2017`, name = 'Oficial 2017', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2020`, name = 'Oficial 2020', mode = 'markers')
p7 Ingreso del trabajo hogar:
7.1 yautcorh 2009-2020
datos_oficiales <- read_xlsx("ingresos_oficiales_2006-2020.xlsx")
datos_oficiales <- cbind(datos_oficiales[,c(9,10)],mutate_if(datos_oficiales[,2:8], is.character, as.numeric))
datos_oficiales <- filter(datos_oficiales, grepl("autonomo", ingreso) )
# datos_oficiales
# kbl(datos_oficiales) %>%
# kable_styling(bootstrap_options = c("striped", "hover")) %>%
# kable_paper() %>%
# scroll_box(width = "100%", height = "300px")
#### 2020
tabla_prom_reg <- data.frame()
for (i in reg_20) {
casen_fh <- filter(casen2020, casen2020$region == i)
casen_fh <- casen_fh[,c("region","folio","yautcorh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2020 = mean(rr$yautcorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2020")]
tabla_2020 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2020 <- tabla_2020[,-c(3)]
tabla_prom_reg <- data.frame()
for (i in reg_17) {
casen_fh <- filter(casen2017, casen2017$region == i)
casen_fh <- casen_fh[,c("region","folio","yautcorh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2017 = mean(rr$yautcorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2017")]
tabla_2017 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2017 <- tabla_2017[,-c(3)]
#### 2015
tabla_prom_reg <- data.frame()
for (i in reg_15) {
casen_fh <- filter(casen2015, casen2015$region == i)
casen_fh <- casen_fh[,c("region","folio.x","yautcorh")]
casen_fh$folio.x <- as.character(casen_fh$folio.x)
tabla <- table(casen_fh$folio.x)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio.x","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio.x", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio.x ), ]
tabla_reg <- data.frame(
region = i,
calculado_2015 = mean(rr$yautcorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2015")]
tabla_2015 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2015 <- tabla_2015[,-c(3)]
tabla_2015$calculado_2015 <- as.numeric(tabla_2015$calculado_2015)
tabla_2015$region[tabla_2015$region == "Región del Libertador Gral. Bernardo O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
#### 2013
tabla_prom_reg <- data.frame()
for (i in reg_13) {
casen_fh <- filter(casen2013, casen2013$region == i)
casen_fh <- casen_fh[,c("region","folio","yautcorh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2013 = mean(rr$yautcorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2013")]
tabla_2013 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2013 <- tabla_2013[,-c(3)]
tabla_2013$region[tabla_2013$region == "I. Tarapaca"] <- "Región de Tarapacá"
tabla_2013$region[tabla_2013$region == "II. Antofagasta"] <- "Región de Antofagasta"
tabla_2013$region[tabla_2013$region == "III. Atacama"] <- "Región de Atacama"
tabla_2013$region[tabla_2013$region == "IV. Coquimbo"] <- "Región de Coquimbo"
tabla_2013$region[tabla_2013$region == "IX. La Araucanía"] <- "Región de La Araucanía"
tabla_2013$region[tabla_2013$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2013$region[tabla_2013$region == "V. Valparaíso"] <- "Región de Valparaíso"
tabla_2013$region[tabla_2013$region == "VI. O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2013$region[tabla_2013$region == "VII. Maule"] <- "Región del Maule"
tabla_2013$region[tabla_2013$region == "VIII. Biobío"] <- "Región del Biobío"
tabla_2013$region[tabla_2013$region == "X. Los Lagos"] <- "Región de Los Lagos"
tabla_2013$region[tabla_2013$region == "XI. Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2013$region[tabla_2013$region == "XII. Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2013$region[tabla_2013$region == "XIV. Los Ríos"] <- "Región de Los Ríos"
tabla_2013$region[tabla_2013$region == "XV. Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2013$calculado_2013 <- as.numeric(tabla_2013$calculado_2013)
#### 2011
tabla_prom_reg <- data.frame()
for (i in reg_11) {
casen_fh <- filter(casen2011, casen2011$region == i)
casen_fh <- casen_fh[,c("region","folio","yauthaj")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2011 = mean(rr$yauthaj)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2011")]
tabla_2011 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2011 <- tabla_2011[,-c(3)]
tabla_2011$region[tabla_2011$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2011$region[tabla_2011$region == "Araucanía"] <- "Región de La Araucanía"
tabla_2011$region[tabla_2011$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2011$region[tabla_2011$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2011$region[tabla_2011$region == "Bio Bio"] <- "Región del Biobío"
tabla_2011$region[tabla_2011$region == "Copiapó"] <- "Región de Atacama"
tabla_2011$region[tabla_2011$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2011$region[tabla_2011$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2011$region[tabla_2011$region == "Los Ríos"] <- "Región de Los Ríos"
tabla_2011$region[tabla_2011$region == "Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2011$region[tabla_2011$region == "Maule"] <- "Región del Maule"
tabla_2011$region[tabla_2011$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2011$region[tabla_2011$region == "O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2011$region[tabla_2011$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2011$region[tabla_2011$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2011$calculado_2011 <- as.numeric(tabla_2011$calculado_2011)
#### 2009
tabla_prom_reg <- data.frame()
for (i in reg_09) {
casen_fh <- filter(casen2009, casen2009$REGION == i)
casen_fh <- casen_fh[,c("REGION","FOLIO","YAUTHAJ")]
casen_fh$FOLIO <- as.character(casen_fh$FOLIO)
tabla <- table(casen_fh$FOLIO)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("FOLIO","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "FOLIO", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$FOLIO ), ]
tabla_reg <- data.frame(
region = i,
calculado_2009 = mean(rr$YAUTHAJ)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2009")]
tabla_2009 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2009 <- tabla_2009[,-c(3)]
tabla_2009$region[tabla_2009$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2009$region[tabla_2009$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2009$region[tabla_2009$region == "Atacama"] <- "Región de Atacama"
tabla_2009$region[tabla_2009$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2009$region[tabla_2009$region == "Bío Bío"] <- "Región del Biobío"
tabla_2009$region[tabla_2009$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2009$region[tabla_2009$region == "La Araucanía"] <- "Región de La Araucanía"
tabla_2009$region[tabla_2009$region == "Libertador Bernardo O´Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2009$region[tabla_2009$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2009$region[tabla_2009$region == "Los Rios"] <- "Región de Los Ríos"
tabla_2009$region[tabla_2009$region == "Magallanes Y La Antártica Chilena"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2009$region[tabla_2009$region == "Maule"] <- "Región del Maule"
tabla_2009$region[tabla_2009$region == "Región Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2009$region[tabla_2009$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2009$region[tabla_2009$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2009$calculado_2009 <- as.numeric(tabla_2009$calculado_2009)
tabla_2017$region[tabla_2017$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2017$region[tabla_2017$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2020$region[tabla_2020$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2020$region[tabla_2020$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"ingresos = merge(x = tabla_2017, y = tabla_2020, by = "region", all.x = T)
ingresos = merge(x = tabla_2015, y = ingresos, by = "region", all.x = T)
ingresos = merge(x = tabla_2013, y = ingresos, by = "region", all.x = T)
ingresos = merge(x = tabla_2011, y = ingresos, by = "region", all.x = T)
ingresos = merge(x = tabla_2009, y = ingresos, by = "region", all.x = T)
datos_oficiales$region[datos_oficiales$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
datos_oficiales$region[datos_oficiales$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_f = merge( x = ingresos, y = datos_oficiales, by = "region" , all.x = T)
tabla_f <- tabla_f[,c(8,1:7,9:15)]
tabla_f$por_09_11 <- 100*tabla_f$calculado_2009/tabla_f$calculado_2011
tabla_f$por_11_13 <- 100*tabla_f$calculado_2011/tabla_f$calculado_2013
tabla_f$por_13_15 <- 100*tabla_f$calculado_2013/tabla_f$calculado_2015
tabla_f$por_15_17 <- 100*tabla_f$calculado_2015/tabla_f$calculado_2017
tabla_f$por_17_20 <- 100*tabla_f$calculado_2017/tabla_f$calculado_2020
tabla_f%>% datatable(extensions = 'Buttons',class = 'cell-border stripe',
options = list(
dom = 'Blfrtip',
buttons = c('copy', 'csv', 'excel', 'pdf', 'print'),
pageLength = 5,
autoWidth = TRUE,
scrollX = TRUE,
lengthMenu = list(c(10,25,50,-1),c(10,25,50,"All"))
)) 8 Comparación de los ingresos por tipo y región entre los años 2017-2020
p <- plot_ly(tabla_f, width = 1200, x = ~region, y = ~calculado_2009, name = 'calculado 2009', mode = 'markers') %>% add_lines()
p <- p %>% add_lines(y = ~calculado_2011, name = 'calculado 2011', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2013, name = 'calculado 2013', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2015, name = 'calculado 2015', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2017, name = 'calculado 2017', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2020, name = 'calculado 2020', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2009`, name = 'Oficial 2009', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2011`, name = 'Oficial 2011', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2013`, name = 'Oficial 2013', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2015`, name = 'Oficial 2015', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2017`, name = 'Oficial 2017', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2020`, name = 'Oficial 2020', mode = 'markers')
p9 Generalización sobre los ingresos y las Casen entre 2009-2020
Ingreso del trabajo hogar
9.1 yautcorh 2009-2020
datos_oficiales <- read_xlsx("ingresos_oficiales_2006-2020.xlsx")
datos_oficiales <- cbind(datos_oficiales[,c(9,10)],mutate_if(datos_oficiales[,2:8], is.character, as.numeric))
datos_oficiales <- filter(datos_oficiales, grepl("ing_mone", ingreso) )
# datos_oficiales
# kbl(datos_oficiales) %>%
# kable_styling(bootstrap_options = c("striped", "hover")) %>%
# kable_paper() %>%
# scroll_box(width = "100%", height = "300px")
tabla_prom_reg <- data.frame()
for (i in reg_20) {
casen_fh <- filter(casen2020, casen2020$region == i)
casen_fh <- casen_fh[,c("region","folio","ymonecorh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2020 = mean(rr$ymonecorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2020")]
tabla_2020 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2020 <- tabla_2020[,-c(3)]
tabla_prom_reg <- data.frame()
for (i in reg_17) {
casen_fh <- filter(casen2017, casen2017$region == i)
casen_fh <- casen_fh[,c("region","folio","ymonecorh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2017 = mean(rr$ymonecorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2017")]
tabla_2017 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2017 <- tabla_2017[,-c(3)]
#### 2015
tabla_prom_reg <- data.frame()
for (i in reg_15) {
casen_fh <- filter(casen2015, casen2015$region == i)
casen_fh <- casen_fh[,c("region","folio.x","ymoneCorh")]
casen_fh$folio.x <- as.character(casen_fh$folio.x)
tabla <- table(casen_fh$folio.x)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio.x","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio.x", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio.x ), ]
tabla_reg <- data.frame(
region = i,
calculado_2015 = mean(rr$ymoneCorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2015")]
tabla_2015 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2015 <- tabla_2015[,-c(3)]
tabla_2015$calculado_2015 <- as.numeric(tabla_2015$calculado_2015)
tabla_2015$region[tabla_2015$region == "Región del Libertador Gral. Bernardo O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
#### 2013
tabla_prom_reg <- data.frame()
for (i in reg_13) {
casen_fh <- filter(casen2013, casen2013$region == i)
casen_fh <- casen_fh[,c("region","folio","ymoneCorh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2013 = mean(rr$ymoneCorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2013")]
tabla_2013 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2013 <- tabla_2013[,-c(3)]
tabla_2013$region[tabla_2013$region == "I. Tarapaca"] <- "Región de Tarapacá"
tabla_2013$region[tabla_2013$region == "II. Antofagasta"] <- "Región de Antofagasta"
tabla_2013$region[tabla_2013$region == "III. Atacama"] <- "Región de Atacama"
tabla_2013$region[tabla_2013$region == "IV. Coquimbo"] <- "Región de Coquimbo"
tabla_2013$region[tabla_2013$region == "IX. La Araucanía"] <- "Región de La Araucanía"
tabla_2013$region[tabla_2013$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2013$region[tabla_2013$region == "V. Valparaíso"] <- "Región de Valparaíso"
tabla_2013$region[tabla_2013$region == "VI. O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2013$region[tabla_2013$region == "VII. Maule"] <- "Región del Maule"
tabla_2013$region[tabla_2013$region == "VIII. Biobío"] <- "Región del Biobío"
tabla_2013$region[tabla_2013$region == "X. Los Lagos"] <- "Región de Los Lagos"
tabla_2013$region[tabla_2013$region == "XI. Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2013$region[tabla_2013$region == "XII. Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2013$region[tabla_2013$region == "XIV. Los Ríos"] <- "Región de Los Ríos"
tabla_2013$region[tabla_2013$region == "XV. Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2013$calculado_2013 <- as.numeric(tabla_2013$calculado_2013)
#### 2011
tabla_prom_reg <- data.frame()
for (i in reg_11) {
casen_fh <- filter(casen2011, casen2011$region == i)
casen_fh <- casen_fh[,c("region","folio","ymonehaj")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2011 = mean(rr$ymonehaj)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2011")]
tabla_2011 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2011 <- tabla_2011[,-c(3)]
tabla_2011$region[tabla_2011$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2011$region[tabla_2011$region == "Araucanía"] <- "Región de La Araucanía"
tabla_2011$region[tabla_2011$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2011$region[tabla_2011$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2011$region[tabla_2011$region == "Bio Bio"] <- "Región del Biobío"
tabla_2011$region[tabla_2011$region == "Copiapó"] <- "Región de Atacama"
tabla_2011$region[tabla_2011$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2011$region[tabla_2011$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2011$region[tabla_2011$region == "Los Ríos"] <- "Región de Los Ríos"
tabla_2011$region[tabla_2011$region == "Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2011$region[tabla_2011$region == "Maule"] <- "Región del Maule"
tabla_2011$region[tabla_2011$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2011$region[tabla_2011$region == "O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2011$region[tabla_2011$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2011$region[tabla_2011$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2011$calculado_2011 <- as.numeric(tabla_2011$calculado_2011)
#### 2009
tabla_prom_reg <- data.frame()
for (i in reg_09) {
casen_fh <- filter(casen2009, casen2009$REGION == i)
casen_fh <- casen_fh[,c("REGION","FOLIO","YMONEHAJ")]
casen_fh$FOLIO <- as.character(casen_fh$FOLIO)
tabla <- table(casen_fh$FOLIO)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("FOLIO","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "FOLIO", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$FOLIO ), ]
tabla_reg <- data.frame(
region = i,
calculado_2009 = mean(rr$YMONEHAJ)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2009")]
tabla_2009 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2009 <- tabla_2009[,-c(3)]
tabla_2009$region[tabla_2009$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2009$region[tabla_2009$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2009$region[tabla_2009$region == "Atacama"] <- "Región de Atacama"
tabla_2009$region[tabla_2009$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2009$region[tabla_2009$region == "Bío Bío"] <- "Región del Biobío"
tabla_2009$region[tabla_2009$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2009$region[tabla_2009$region == "La Araucanía"] <- "Región de La Araucanía"
tabla_2009$region[tabla_2009$region == "Libertador Bernardo O´Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2009$region[tabla_2009$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2009$region[tabla_2009$region == "Los Rios"] <- "Región de Los Ríos"
tabla_2009$region[tabla_2009$region == "Magallanes Y La Antártica Chilena"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2009$region[tabla_2009$region == "Maule"] <- "Región del Maule"
tabla_2009$region[tabla_2009$region == "Región Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2009$region[tabla_2009$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2009$region[tabla_2009$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2009$calculado_2009 <- as.numeric(tabla_2009$calculado_2009)
tabla_2017$region[tabla_2017$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2017$region[tabla_2017$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2020$region[tabla_2020$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2020$region[tabla_2020$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"ingresos = merge(x = tabla_2017, y = tabla_2020, by = "region", all.x = T)
ingresos = merge(x = tabla_2015, y = ingresos, by = "region", all.x = T)
ingresos = merge(x = tabla_2013, y = ingresos, by = "region", all.x = T)
ingresos = merge(x = tabla_2011, y = ingresos, by = "region", all.x = T)
ingresos = merge(x = tabla_2009, y = ingresos, by = "region", all.x = T)
datos_oficiales$region[datos_oficiales$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
datos_oficiales$region[datos_oficiales$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_f = merge( x = ingresos, y = datos_oficiales, by = "region" , all.x = T)
tabla_f <- tabla_f[,c(8,1:7,9:15)]
tabla_f$por_09_11 <- 100*tabla_f$calculado_2009/tabla_f$calculado_2011
tabla_f$por_11_13 <- 100*tabla_f$calculado_2011/tabla_f$calculado_2013
tabla_f$por_13_15 <- 100*tabla_f$calculado_2013/tabla_f$calculado_2015
tabla_f$por_15_17 <- 100*tabla_f$calculado_2015/tabla_f$calculado_2017
tabla_f$por_17_20 <- 100*tabla_f$calculado_2017/tabla_f$calculado_2020
tabla_f%>% datatable(extensions = 'Buttons',class = 'cell-border stripe',
options = list(
dom = 'Blfrtip',
buttons = c('copy', 'csv', 'excel', 'pdf', 'print'),
pageLength = 5,
autoWidth = TRUE,
scrollX = TRUE,
lengthMenu = list(c(10,25,50,-1),c(10,25,50,"All"))
)) 10 Comparación de los ingresos por tipo y región entre los años 2017-2020
p <- plot_ly(tabla_f, width = 1200, x = ~region, y = ~calculado_2009, name = 'calculado 2009', mode = 'markers') %>% add_lines()
p <- p %>% add_lines(y = ~calculado_2011, name = 'calculado 2011', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2013, name = 'calculado 2013', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2015, name = 'calculado 2015', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2017, name = 'calculado 2017', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2020, name = 'calculado 2020', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2009`, name = 'Oficial 2009', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2011`, name = 'Oficial 2011', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2013`, name = 'Oficial 2013', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2015`, name = 'Oficial 2015', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2017`, name = 'Oficial 2017', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2020`, name = 'Oficial 2020', mode = 'markers')
p11 Ingreso del trabajo hogar
11.1 yautcorh 2009-2020
Datos oficiales
datos_oficiales <- read_xlsx("ingresos_oficiales_2006-2020.xlsx")
datos_oficiales <- cbind(datos_oficiales[,c(9,10)],mutate_if(datos_oficiales[,2:8], is.character, as.numeric))
datos_oficiales <- filter(datos_oficiales, grepl("sub_mone", ingreso) )
# datos_oficiales
tabla_prom_reg <- data.frame()
for (i in reg_20) {
casen_fh <- filter(casen2020, casen2020$region == i)
casen_fh <- casen_fh[,c("region","folio","ysubh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2020 = mean(rr$ysubh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2020")]
tabla_2020 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2020 <- tabla_2020[,-c(3)]
tabla_prom_reg <- data.frame()
for (i in reg_17) {
casen_fh <- filter(casen2017, casen2017$region == i)
casen_fh <- casen_fh[,c("region","folio","ysubh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2017 = mean(rr$ysubh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2017")]
tabla_2017 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2017 <- tabla_2017[,-c(3)]
#### 2015
tabla_prom_reg <- data.frame()
for (i in reg_15) {
casen_fh <- filter(casen2015, casen2015$region == i)
casen_fh <- casen_fh[,c("region","folio.x","ysubh")]
casen_fh$folio.x <- as.character(casen_fh$folio.x)
tabla <- table(casen_fh$folio.x)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio.x","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio.x", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio.x ), ]
tabla_reg <- data.frame(
region = i,
calculado_2015 = mean(rr$ysubh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2015")]
tabla_2015 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2015 <- tabla_2015[,-c(3)]
tabla_2015$calculado_2015 <- as.numeric(tabla_2015$calculado_2015)
tabla_2015$region[tabla_2015$region == "Región del Libertador Gral. Bernardo O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
#### 2013
tabla_prom_reg <- data.frame()
for (i in reg_13) {
casen_fh <- filter(casen2013, casen2013$region == i)
casen_fh <- casen_fh[,c("region","folio","ysubh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2013 = mean(rr$ysubh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2013")]
tabla_2013 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2013 <- tabla_2013[,-c(3)]
tabla_2013$region[tabla_2013$region == "I. Tarapaca"] <- "Región de Tarapacá"
tabla_2013$region[tabla_2013$region == "II. Antofagasta"] <- "Región de Antofagasta"
tabla_2013$region[tabla_2013$region == "III. Atacama"] <- "Región de Atacama"
tabla_2013$region[tabla_2013$region == "IV. Coquimbo"] <- "Región de Coquimbo"
tabla_2013$region[tabla_2013$region == "IX. La Araucanía"] <- "Región de La Araucanía"
tabla_2013$region[tabla_2013$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2013$region[tabla_2013$region == "V. Valparaíso"] <- "Región de Valparaíso"
tabla_2013$region[tabla_2013$region == "VI. O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2013$region[tabla_2013$region == "VII. Maule"] <- "Región del Maule"
tabla_2013$region[tabla_2013$region == "VIII. Biobío"] <- "Región del Biobío"
tabla_2013$region[tabla_2013$region == "X. Los Lagos"] <- "Región de Los Lagos"
tabla_2013$region[tabla_2013$region == "XI. Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2013$region[tabla_2013$region == "XII. Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2013$region[tabla_2013$region == "XIV. Los Ríos"] <- "Región de Los Ríos"
tabla_2013$region[tabla_2013$region == "XV. Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2013$calculado_2013 <- as.numeric(tabla_2013$calculado_2013)
#### 2011
tabla_prom_reg <- data.frame()
for (i in reg_11) {
casen_fh <- filter(casen2011, casen2011$region == i)
casen_fh <- casen_fh[,c("region","folio","ysubhaj")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2011 = mean(rr$ysubhaj)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2011")]
tabla_2011 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2011 <- tabla_2011[,-c(3)]
tabla_2011$region[tabla_2011$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2011$region[tabla_2011$region == "Araucanía"] <- "Región de La Araucanía"
tabla_2011$region[tabla_2011$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2011$region[tabla_2011$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2011$region[tabla_2011$region == "Bio Bio"] <- "Región del Biobío"
tabla_2011$region[tabla_2011$region == "Copiapó"] <- "Región de Atacama"
tabla_2011$region[tabla_2011$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2011$region[tabla_2011$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2011$region[tabla_2011$region == "Los Ríos"] <- "Región de Los Ríos"
tabla_2011$region[tabla_2011$region == "Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2011$region[tabla_2011$region == "Maule"] <- "Región del Maule"
tabla_2011$region[tabla_2011$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2011$region[tabla_2011$region == "O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2011$region[tabla_2011$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2011$region[tabla_2011$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2011$calculado_2011 <- as.numeric(tabla_2011$calculado_2011)
#### 2009
tabla_prom_reg <- data.frame()
for (i in reg_09) {
casen_fh <- filter(casen2009, casen2009$REGION == i)
casen_fh <- casen_fh[,c("REGION","FOLIO","YSUBHAJ")]
casen_fh$FOLIO <- as.character(casen_fh$FOLIO)
tabla <- table(casen_fh$FOLIO)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("FOLIO","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "FOLIO", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$FOLIO ), ]
tabla_reg <- data.frame(
region = i,
calculado_2009 = mean(rr$YSUBHAJ)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2009")]
tabla_2009 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2009 <- tabla_2009[,-c(3)]
tabla_2009$region[tabla_2009$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2009$region[tabla_2009$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2009$region[tabla_2009$region == "Atacama"] <- "Región de Atacama"
tabla_2009$region[tabla_2009$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2009$region[tabla_2009$region == "Bío Bío"] <- "Región del Biobío"
tabla_2009$region[tabla_2009$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2009$region[tabla_2009$region == "La Araucanía"] <- "Región de La Araucanía"
tabla_2009$region[tabla_2009$region == "Libertador Bernardo O´Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2009$region[tabla_2009$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2009$region[tabla_2009$region == "Los Rios"] <- "Región de Los Ríos"
tabla_2009$region[tabla_2009$region == "Magallanes Y La Antártica Chilena"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2009$region[tabla_2009$region == "Maule"] <- "Región del Maule"
tabla_2009$region[tabla_2009$region == "Región Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2009$region[tabla_2009$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2009$region[tabla_2009$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2009$calculado_2009 <- as.numeric(tabla_2009$calculado_2009)
tabla_2017$region[tabla_2017$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2017$region[tabla_2017$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2020$region[tabla_2020$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2020$region[tabla_2020$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"Datos calculados
ingresos = merge(x = tabla_2017, y = tabla_2020, by = "region", all.x = T)
ingresos = merge(x = tabla_2015, y = ingresos, by = "region", all.x = T)
ingresos = merge(x = tabla_2013, y = ingresos, by = "region", all.x = T)
ingresos = merge(x = tabla_2011, y = ingresos, by = "region", all.x = T)
ingresos = merge(x = tabla_2009, y = ingresos, by = "region", all.x = T)
datos_oficiales$region[datos_oficiales$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
datos_oficiales$region[datos_oficiales$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_f = merge( x = ingresos, y = datos_oficiales, by = "region" , all.x = T)
tabla_f <- tabla_f[,c(8,1:7,9:15)]
tabla_f$por_09_11 <- 100*tabla_f$calculado_2009/tabla_f$calculado_2011
tabla_f$por_11_13 <- 100*tabla_f$calculado_2011/tabla_f$calculado_2013
tabla_f$por_13_15 <- 100*tabla_f$calculado_2013/tabla_f$calculado_2015
tabla_f$por_15_17 <- 100*tabla_f$calculado_2015/tabla_f$calculado_2017
tabla_f$por_17_20 <- 100*tabla_f$calculado_2017/tabla_f$calculado_2020
tabla_f %>% datatable(extensions = 'Buttons',class = 'cell-border stripe',
options = list(
dom = 'Blfrtip',
buttons = c('copy', 'csv', 'excel', 'pdf', 'print'),
pageLength = 5,
autoWidth = TRUE,
scrollX = TRUE,
lengthMenu = list(c(10,25,50,-1),c(10,25,50,"All"))
)) 12 Comparación de los ingresos por tipo y región entre los años 2017-2020
p <- plot_ly(tabla_f, width = 1200, x = ~region, y = ~calculado_2009, name = 'calculado 2009', mode = 'markers') %>% add_lines()
p <- p %>% add_lines(y = ~calculado_2011, name = 'calculado 2011', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2013, name = 'calculado 2013', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2015, name = 'calculado 2015', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2017, name = 'calculado 2017', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2020, name = 'calculado 2020', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2009`, name = 'Oficial 2009', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2011`, name = 'Oficial 2011', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2013`, name = 'Oficial 2013', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2015`, name = 'Oficial 2015', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2017`, name = 'Oficial 2017', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2020`, name = 'Oficial 2020', mode = 'markers')
p12.0.1 Ingreso del trabajo hogar: yautcorh 2009-2020
Datos oficiales
datos_oficiales <- read_xlsx("ingresos_oficiales_2006-2020.xlsx")
datos_oficiales <- cbind(datos_oficiales[,c(9,10)],mutate_if(datos_oficiales[,2:8], is.character, as.numeric))
datos_oficiales <- filter(datos_oficiales, grepl("ing_mone", ingreso) )
# datos_oficiales
tabla_prom_reg <- data.frame()
for (i in reg_20) {
casen_fh <- filter(casen2020, casen2020$region == i)
casen_fh <- casen_fh[,c("region","folio","ymonecorh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2020 = mean(rr$ymonecorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2020")]
tabla_2020 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2020 <- tabla_2020[,-c(3)]
tabla_prom_reg <- data.frame()
for (i in reg_17) {
casen_fh <- filter(casen2017, casen2017$region == i)
casen_fh <- casen_fh[,c("region","folio","ymonecorh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2017 = mean(rr$ymonecorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2017")]
tabla_2017 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2017 <- tabla_2017[,-c(3)]
#### 2015
tabla_prom_reg <- data.frame()
for (i in reg_15) {
casen_fh <- filter(casen2015, casen2015$region == i)
casen_fh <- casen_fh[,c("region","folio.x","ymoneCorh")]
casen_fh$folio.x <- as.character(casen_fh$folio.x)
tabla <- table(casen_fh$folio.x)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio.x","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio.x", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio.x ), ]
tabla_reg <- data.frame(
region = i,
calculado_2015 = mean(rr$ymoneCorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2015")]
tabla_2015 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2015 <- tabla_2015[,-c(3)]
tabla_2015$calculado_2015 <- as.numeric(tabla_2015$calculado_2015)
tabla_2015$region[tabla_2015$region == "Región del Libertador Gral. Bernardo O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
#### 2013
tabla_prom_reg <- data.frame()
for (i in reg_13) {
casen_fh <- filter(casen2013, casen2013$region == i)
casen_fh <- casen_fh[,c("region","folio","ymoneCorh")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2013 = mean(rr$ymoneCorh)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2013")]
tabla_2013 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2013 <- tabla_2013[,-c(3)]
tabla_2013$region[tabla_2013$region == "I. Tarapaca"] <- "Región de Tarapacá"
tabla_2013$region[tabla_2013$region == "II. Antofagasta"] <- "Región de Antofagasta"
tabla_2013$region[tabla_2013$region == "III. Atacama"] <- "Región de Atacama"
tabla_2013$region[tabla_2013$region == "IV. Coquimbo"] <- "Región de Coquimbo"
tabla_2013$region[tabla_2013$region == "IX. La Araucanía"] <- "Región de La Araucanía"
tabla_2013$region[tabla_2013$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2013$region[tabla_2013$region == "V. Valparaíso"] <- "Región de Valparaíso"
tabla_2013$region[tabla_2013$region == "VI. O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2013$region[tabla_2013$region == "VII. Maule"] <- "Región del Maule"
tabla_2013$region[tabla_2013$region == "VIII. Biobío"] <- "Región del Biobío"
tabla_2013$region[tabla_2013$region == "X. Los Lagos"] <- "Región de Los Lagos"
tabla_2013$region[tabla_2013$region == "XI. Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2013$region[tabla_2013$region == "XII. Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2013$region[tabla_2013$region == "XIV. Los Ríos"] <- "Región de Los Ríos"
tabla_2013$region[tabla_2013$region == "XV. Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2013$calculado_2013 <- as.numeric(tabla_2013$calculado_2013)
#### 2011
tabla_prom_reg <- data.frame()
for (i in reg_11) {
casen_fh <- filter(casen2011, casen2011$region == i)
casen_fh <- casen_fh[,c("region","folio","ymonehaj")]
casen_fh$folio <- as.character(casen_fh$folio)
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]
tabla_reg <- data.frame(
region = i,
calculado_2011 = mean(rr$ymonehaj)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2011")]
tabla_2011 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2011 <- tabla_2011[,-c(3)]
tabla_2011$region[tabla_2011$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2011$region[tabla_2011$region == "Araucanía"] <- "Región de La Araucanía"
tabla_2011$region[tabla_2011$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2011$region[tabla_2011$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2011$region[tabla_2011$region == "Bio Bio"] <- "Región del Biobío"
tabla_2011$region[tabla_2011$region == "Copiapó"] <- "Región de Atacama"
tabla_2011$region[tabla_2011$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2011$region[tabla_2011$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2011$region[tabla_2011$region == "Los Ríos"] <- "Región de Los Ríos"
tabla_2011$region[tabla_2011$region == "Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2011$region[tabla_2011$region == "Maule"] <- "Región del Maule"
tabla_2011$region[tabla_2011$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2011$region[tabla_2011$region == "O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2011$region[tabla_2011$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2011$region[tabla_2011$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2011$calculado_2011 <- as.numeric(tabla_2011$calculado_2011)
#### 2009
tabla_prom_reg <- data.frame()
for (i in reg_09) {
casen_fh <- filter(casen2009, casen2009$REGION == i)
casen_fh <- casen_fh[,c("REGION","FOLIO","YMONEHAJ")]
casen_fh$FOLIO <- as.character(casen_fh$FOLIO)
tabla <- table(casen_fh$FOLIO)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("FOLIO","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "FOLIO", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$FOLIO ), ]
tabla_reg <- data.frame(
region = i,
calculado_2009 = mean(rr$YMONEHAJ)
)
tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)
}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
tabla_ing_aut <- datos_oficiales[,c("region","publicado_2009")]
tabla_2009 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2009 <- tabla_2009[,-c(3)]
tabla_2009$region[tabla_2009$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2009$region[tabla_2009$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2009$region[tabla_2009$region == "Atacama"] <- "Región de Atacama"
tabla_2009$region[tabla_2009$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2009$region[tabla_2009$region == "Bío Bío"] <- "Región del Biobío"
tabla_2009$region[tabla_2009$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2009$region[tabla_2009$region == "La Araucanía"] <- "Región de La Araucanía"
tabla_2009$region[tabla_2009$region == "Libertador Bernardo O´Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2009$region[tabla_2009$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2009$region[tabla_2009$region == "Los Rios"] <- "Región de Los Ríos"
tabla_2009$region[tabla_2009$region == "Magallanes Y La Antártica Chilena"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2009$region[tabla_2009$region == "Maule"] <- "Región del Maule"
tabla_2009$region[tabla_2009$region == "Región Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2009$region[tabla_2009$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2009$region[tabla_2009$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2009$calculado_2009 <- as.numeric(tabla_2009$calculado_2009)
tabla_2017$region[tabla_2017$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2017$region[tabla_2017$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2020$region[tabla_2020$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2020$region[tabla_2020$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"Datos calculados
ingresos = merge(x = tabla_2017, y = tabla_2020, by = "region", all.x = T)
ingresos = merge(x = tabla_2015, y = ingresos, by = "region", all.x = T)
ingresos = merge(x = tabla_2013, y = ingresos, by = "region", all.x = T)
ingresos = merge(x = tabla_2011, y = ingresos, by = "region", all.x = T)
ingresos = merge(x = tabla_2009, y = ingresos, by = "region", all.x = T)
datos_oficiales$region[datos_oficiales$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
datos_oficiales$region[datos_oficiales$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_f = merge( x = ingresos, y = datos_oficiales, by = "region" , all.x = T)
tabla_f <- tabla_f[,c(8,1:7,9:15)]
tabla_f$por_09_11 <- 100*tabla_f$calculado_2009/tabla_f$calculado_2011
tabla_f$por_11_13 <- 100*tabla_f$calculado_2011/tabla_f$calculado_2013
tabla_f$por_13_15 <- 100*tabla_f$calculado_2013/tabla_f$calculado_2015
tabla_f$por_15_17 <- 100*tabla_f$calculado_2015/tabla_f$calculado_2017
tabla_f$por_17_20 <- 100*tabla_f$calculado_2017/tabla_f$calculado_2020
tabla_f%>% datatable(extensions = 'Buttons',class = 'cell-border stripe',
options = list(
dom = 'Blfrtip',
buttons = c('copy', 'csv', 'excel', 'pdf', 'print'),
pageLength = 5,
autoWidth = TRUE,
scrollX = TRUE,
lengthMenu = list(c(10,25,50,-1),c(10,25,50,"All"))
)) 13 Comparación de los ingresos por tipo y región entre los años 2017-2020
p <- plot_ly(tabla_f, width = 1200, x = ~region, y = ~calculado_2009, name = 'calculado 2009', mode = 'markers') %>% add_lines()
p <- p %>% add_lines(y = ~calculado_2011, name = 'calculado 2011', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2013, name = 'calculado 2013', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2015, name = 'calculado 2015', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2017, name = 'calculado 2017', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2020, name = 'calculado 2020', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2009`, name = 'Oficial 2009', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2011`, name = 'Oficial 2011', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2013`, name = 'Oficial 2013', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2015`, name = 'Oficial 2015', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2017`, name = 'Oficial 2017', mode = 'markers')
p <- p %>% add_trace(y = ~`publicado_2020`, name = 'Oficial 2020', mode = 'markers')
p14 Validación de los diferentes tipos de ingreso de la Casen comparando calculos propios con los oficiales ($ noviembre de cada año)
link 1(ver aquí)
link 2 (ver aquí)
POBREZA EN PORCENTAJE DE PERSONAS 2006
unique(casen2006$CORTE)## [1] "No pobre" "Indigente" "Pobre no indigente"
## [4] NA
tabla_matp <-xtabs(casen2006$EXPC~COMUNA+CORTE, data = casen2006)
head(tabla_matp,10)## CORTE
## COMUNA Indigente No pobre Pobre no indigente
## Aisén 776 22452 402
## Algarrobo 307 9647 831
## Alhué 166 4013 441
## Alto Bío Bío 1317 5825 1936
## Alto del Carmen 0 4450 61
## Alto Hospicio 3523 58114 12901
## Ancud 309 37931 2579
## Andacollo 421 6746 2041
## Angol 3302 37857 7814
## Antofagasta 8968 305199 10778
s1 <- sum(tabla_matp[,1])+sum(tabla_matp[,2])+sum(tabla_matp[,3])
s2 <- sum(tabla_matp[,1])
s2*100/s1## [1] 3.206491
casen_2006_r1 <- filter(casen2006, casen2006$R == "VIII")
# head(casen_2006_r1)# casen_2006_r1 %>% filter(!is.na(CORTE))
tabla_matp <-xtabs(casen_2006_r1$EXPR~R+CORTE, data = casen_2006_r1)
# head(tabla_matp,10)s1 <- sum(tabla_matp[,1])+sum(tabla_matp[,2])+sum(tabla_matp[,3])
s2 <- sum(tabla_matp[,3])
s2*100/s1## [1] 15.51188
15 El ingreso autónomo per cápita del hogar
15.1 Ingreso autónomo percápita del hogar, CASEN 2011 ($ de noviembre de 2011)
Ingreso autónomo per cápita del hogar, promedio de los hogares es el Valor correspondiente a la suma de los ingresos autónomos per cápita de todos los hogares, dividido por el total de hogares.
El ingreso autónomo se define como todos los pagos que recibe el hogar, provenientes tanto del trabajo como de la propiedad de los activos. Estos incluyen sueldos y salarios (monetarios y en especies), ganancias provenientes del trabajo independiente, la auto provisión de bienes producidos por el hogar, rentas, intereses, jubilaciones, pensiones, montepíos y transferencias corrientes entre privados.
El ingreso autónomo per cápita del hogar es la suma de los ingresos autónomos de todos los miembros del hogar, dividido por el número de integrantes del hogar, excluido el servicio doméstico puertas adentro.
folio: Identificación del hogar.
casen2011 <- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2011_c.rds")
# casen2011 <- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2011_c.rds")
casen2011 <- mutate_if(casen2011, is.factor, as.character)
# head(casen2011,5)15.1.1 Hacemos un subset con la region metropolitana
casen2011_rm <- filter(casen2011, casen2011$region == "Metropolitana")# comuna_ing <- unique(casen2011_rm$comuna)
tabla <- table(casen2011_rm$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
head(tabla,10)## folio freq_folio
## 1 131011001011 1
## 2 131011001041 1
## 3 131011001061 1
## 4 131011001121 1
## 5 131011001131 1
## 6 131011001161 1
## 7 131011001191 3
## 8 131011001201 1
## 9 131011001211 1
## 10 131011001221 2
casen_fh <- casen2011_rm[,c("comuna","folio","yauthaj","expc_full","numper")]
casen_fh$folio <- as.character(casen_fh$folio)
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
#repetidos2 <- repetidos2[,c(2,1,6,4,5)]
rr <- repetidos2[!duplicated(repetidos2$folio), ]
head(rr,10)## folio comuna yauthaj expc_full numper freq_folio
## 1 131011001011 Santiago 1653583 94 1 1
## 2 131011001041 Santiago 560401 94 1 1
## 3 131011001061 Santiago 1044093 94 1 1
## 4 131011001121 Santiago 1430074 94 1 1
## 5 131011001131 Santiago 444180 94 1 1
## 6 131011001161 Santiago 613347 94 1 1
## 7 131011001191 Santiago 1235752 94 3 3
## 10 131011001201 Santiago 1674543 94 1 1
## 11 131011001211 Santiago 295815 94 1 1
## 12 131011001221 Santiago 3461482 94 2 2
Aca vamos a calcular promedios de personas por hogar:
rr$ing_per_h <- rr$yauthaj/rr$freq_folio
aaa <- aggregate(rr$ing_per_h, list(rr$comuna), FUN=mean)
names(aaa)[1]<-c("Comuna")
aaa$`mean.rr$ing_per_h` <- as.numeric(aaa$`mean.rr$ing_per_h`)
names(aaa)[2]<-c("calculo_propio")
write_xlsx(aaa, "aaaa.xlsx")
bbb <- read.csv2("ing_aut_percap_del_hogar_casen2011.csv")
bbb$`iaph` <- as.numeric(bbb$`iaph`)
names(bbb)[1] <- "Comuna"
ccc <- merge(x = aaa, y = bbb, by = "Comuna", all.x = TRUE)p <- plot_ly(ccc, width = 1200, x = ~
Comuna, y = ~calculo_propio) %>%
add_lines()
#p <- plot_ly(width = 800, height = 800)
p <- p %>% add_trace(y = ~iaph, name = 'iaph', mode = 'markers')
p## No trace type specified:
## Based on info supplied, a 'bar' trace seems appropriate.
## Read more about this trace type -> https://plotly.com/r/reference/#bar
## Warning: 'bar' objects don't have these attributes: 'mode'
## Valid attributes include:
## 'type', 'visible', 'showlegend', 'legendgroup', 'opacity', 'name', 'uid', 'ids', 'customdata', 'meta', 'selectedpoints', 'hoverinfo', 'hoverlabel', 'stream', 'transforms', 'uirevision', 'x', 'x0', 'dx', 'y', 'y0', 'dy', 'xperiod', 'yperiod', 'xperiod0', 'yperiod0', 'xperiodalignment', 'yperiodalignment', 'text', 'texttemplate', 'hovertext', 'hovertemplate', 'textposition', 'insidetextanchor', 'textangle', 'textfont', 'insidetextfont', 'outsidetextfont', 'constraintext', 'cliponaxis', 'orientation', 'base', 'offset', 'width', 'marker', 'offsetgroup', 'alignmentgroup', 'selected', 'unselected', 'r', 't', '_deprecated', 'error_x', 'error_y', 'xcalendar', 'ycalendar', 'xaxis', 'yaxis', 'idssrc', 'customdatasrc', 'metasrc', 'hoverinfosrc', 'xsrc', 'ysrc', 'textsrc', 'texttemplatesrc', 'hovertextsrc', 'hovertemplatesrc', 'textpositionsrc', 'basesrc', 'offsetsrc', 'widthsrc', 'rsrc', 'tsrc', 'key', 'set', 'frame', 'transforms', '_isNestedKey', '_isSimpleKey', '_isGraticule', '_bbox'
16 Analisis por personas por comuna
Si llegamos a tal nivel de sofisticacion con el percapita y las variables calculadas coinciden con las publicadas sobre varios anos, aunque no exista publicacion oficial con la cual comparar a nivel de personas, nuestras estimaciones deberian estar ok.
Vamos a estimar a nivel porcentual la variación del ingreso total personal entre el 2017 y el 2020 por comuna.
16.1 Ingresos
salida_001 = aggregate(casen2017[,c("ytotcor")],by = list(PAISES = casen2017$comuna), FUN = mean)
names(salida_001)[1]<-c("comunas")
names(salida_001)[2]<-c("promedios totales 2017")
head(salida_001,10)## comunas promedios totales 2017
## 1 Algarrobo 481159.9
## 2 Alhué 376332.9
## 3 Alto Biobío 228063.8
## 4 Alto del Carmen 264821.7
## 5 Alto Hospicio 342817.8
## 6 Ancud 247563.6
## 7 Andacollo 284461.3
## 8 Angol 319658.5
## 9 Antofagasta 562035.7
## 10 Antuco 237217.3
salida_002 = aggregate(casen2020[,c("ytotcor")],by = list(PAISES = casen2020$comuna), FUN = mean)
names(salida_002)[1]<-c("comunas")
names(salida_002)[2]<-c("promedios totales 2020")
head(salida_002,10)## comunas promedios totales 2020
## 1 Algarrobo 260872.7
## 2 Alhué 266054.7
## 3 Alto Biobío 215322.3
## 4 Alto del Carmen 196643.9
## 5 Alto Hospicio 206293.8
## 6 Ancud 224070.3
## 7 Andacollo 186774.1
## 8 Angol 209548.4
## 9 Antofagasta 361246.8
## 10 Antuco 251406.4
union_003 <- merge(salida_001,salida_002, by="comunas", all.x = TRUE)
union_003$difer_por <- (100-100*union_003$`promedios totales 2017`/union_003$`promedios totales 2020`)
head(union_003,10)## comunas promedios totales 2017 promedios totales 2020 difer_por
## 1 Algarrobo 481159.9 260872.7 -84.442416
## 2 Alhué 376332.9 266054.7 -41.449440
## 3 Alto Biobío 228063.8 215322.3 -5.917394
## 4 Alto del Carmen 264821.7 196643.9 -34.670701
## 5 Alto Hospicio 342817.8 206293.8 -66.179407
## 6 Ancud 247563.6 224070.3 -10.484792
## 7 Andacollo 284461.3 186774.1 -52.302359
## 8 Angol 319658.5 209548.4 -52.546365
## 9 Antofagasta 562035.7 361246.8 -55.582207
## 10 Antuco 237217.3 251406.4 5.643907
2009
ab <- casen2009
eliminated <-ab
a <- eliminated$YTOTAJ
b <- eliminated$COMUNA
c <- eliminated$SEXO
d <- eliminated$T5
promedios_grupales <-aggregate(a, by=list(b, c, d), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d), FUN = sd , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
d<-promedios_grupales
d$Año <- "2009"
ttt <- d[complete.cases(d), ]
names(ttt)[1] <- "Comuna"
names(ttt)[2] <- "Sexo"
names(ttt)[3] <- "Etnia"
names(ttt)[4] <- "Promedio"
names(ttt)[5] <- "Desviación standard"
names(ttt)[6] <- "Año"
tttcodigos_comunales <- readRDS(file = "C:/Users/chris/OneDrive/Documentos/archivos_grandes/codigos_comunales_2009.rds")
# codigos_comunales <- readRDS(file = "C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/codigos_comunales_2009.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
df_2009 = merge( x = ttt, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2009 <- df_2009[!(df_2009$Promedio == 0),]
tabla_matp2 <- df_2009[complete.cases(df_2009), ]16.2 Frecuencias
ab <- casen2009
b <- ab$COMUNA
c <- ab$SEXO
d <- ab$T5
tabla_matp <-xtabs(ab$EXPC~b+c+d, data = ab)
tabla_matp <- as.data.frame(tabla_matp)
tabla_matp <-tabla_matp[!(tabla_matp$Freq == 0),]
tabla_matp %>% datatable(extensions = 'Buttons',class = 'cell-border stripe',
options = list(
dom = 'Blfrtip',
buttons = c('copy', 'csv', 'excel', 'pdf', 'print'),
pageLength = 5,
autoWidth = TRUE,
scrollX = TRUE,
lengthMenu = list(c(10,25,50,-1),c(10,25,50,"All"))
)) Uno a nivel comunal en la Región Metropolitana y tres a nivel Regional:
Ingreso autónomo percápita del hogar, CASEN 2011 ($ de noviembre de 2011) de la pagina 16 de aquí.
Ingreso autónomo promedio e ingreso monetario promedio del hogar a nivel regional el 2015:
Por dos instrumentos diferentes oficiales llegamos a los mismos resultados y son a los cuales intentamos aproximarnos.
- Se comparará con la tabla obtenida en las III (ver aquí)
- Y la otra con una página interactiva con datos por región (ver aquí)